<!DOCTYPE html>
<html lang="en">
<head>
	<meta charset="UTF-8">
	<meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
	<title>extended_stats 聚合 | ElasticSearch 7.7 权威指南中文版</title>
	<meta name="keywords" content="ElasticSearch 权威指南中文版, elasticsearch 7, es7, 实时数据分析，实时数据检索" />
    <meta name="description" content="ElasticSearch 权威指南中文版, elasticsearch 7, es7, 实时数据分析，实时数据检索" />
    <!-- Give IE8 a fighting chance -->
    <!--[if lt IE 9]>
    <script src="https://oss.maxcdn.com/html5shiv/3.7.2/html5shiv.min.js"></script>
    <script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
    <![endif]-->
	<link rel="stylesheet" type="text/css" href="../static/styles.css" />
	<script>
	var _link = 'search-aggregations-metrics-extendedstats-aggregation.html';
    </script>
</head>
<body>
<div class="main-container">
    <section id="content">
        <div class="content-wrapper">
            <section id="guide" lang="zh_cn">
                <div class="container">
                    <div class="row">
                        <div class="col-xs-12 col-sm-8 col-md-8 guide-section">
                            <div style="color:gray; word-break: break-all; font-size:12px;">原英文版地址: <a href="https://www.elastic.co/guide/en/elasticsearch/reference/7.7/search-aggregations-metrics-extendedstats-aggregation.html" rel="nofollow" target="_blank">https://www.elastic.co/guide/en/elasticsearch/reference/7.7/search-aggregations-metrics-extendedstats-aggregation.html</a>, 原文档版权归 www.elastic.co 所有<br/>本地英文版地址: <a href="../en/search-aggregations-metrics-extendedstats-aggregation.html" rel="nofollow" target="_blank">../en/search-aggregations-metrics-extendedstats-aggregation.html</a></div>
                        <!-- start body -->
                  <div class="page_header">
<strong>重要</strong>: 此版本不会发布额外的bug修复或文档更新。最新信息请参考 <a href="https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html" rel="nofollow">当前版本文档</a>。
</div>
<div id="content">
<div class="breadcrumbs">
<span class="breadcrumb-link"><a href="index.html">Elasticsearch 权威指南 [7.7]</a></span>
»
<span class="breadcrumb-link"><a href="search-aggregations.html">聚合</a></span>
»
<span class="breadcrumb-link"><a href="search-aggregations-metrics.html">度量聚合</a></span>
»
<span class="breadcrumb-node">extended_stats 聚合</span>
</div>
<div class="navheader">
<span class="prev">
<a href="search-aggregations-metrics-stats-aggregation.html">« stats 聚合</a>
</span>
<span class="next">
<a href="search-aggregations-metrics-geobounds-aggregation.html">geo_bounds 聚合 »</a>
</span>
</div>
<div class="section">
<div class="titlepage"><div><div>
<h2 class="title">
<a id="search-aggregations-metrics-extendedstats-aggregation"></a>extended_stats 聚合
</h2>
</div></div></div>
<p>
一种<code class="literal">multi-value(多值)</code>度量聚合，计算从聚合文档中提取的数值的统计(stats)数据。 值可以从文档的给定的 numeric 字段中提取，也可以由脚本生成。
</p>
<p>
<code class="literal">extended_stats</code> 聚合是 <a class="xref" href="search-aggregations-metrics-stats-aggregation.html" title="stats 聚合"><code class="literal">stats</code></a> 聚合的扩展版本，其中添加了额外的度量，如<code class="literal">sum_of_squares</code>、<code class="literal">variance</code>、<code class="literal">std_deviation</code> 和 <code class="literal">std_deviation_bounds</code>。
</p>
<p>
假设数据由代表学生考试成绩(0到100之间)的文档组成：
</p>
<div class="pre_wrapper lang-console">
<pre class="programlisting prettyprint lang-console">GET /exams/_search
{
    "size": 0,
    "aggs" : {
        "grades_stats" : { "extended_stats" : { "field" : "grade" } }
    }
}</pre>
</div>
<div class="console_widget" data-snippet="snippets/344.console"></div>
<p>
上述聚合计算所有文档的分数统计信息。 

聚合类型是 <code class="literal">extended_stats</code> ，<code class="literal">field</code> 设置定义了用于统计计算的文档的 numeric 字段。 上面的查询将返回以下内容:
</p>
<div class="pre_wrapper lang-console-result">
<pre class="programlisting prettyprint lang-console-result">{
    ...

    "aggregations": {
        "grades_stats": {
           "count": 2,
           "min": 50.0,
           "max": 100.0,
           "avg": 75.0,
           "sum": 150.0,
           "sum_of_squares": 12500.0,
           "variance": 625.0,
           "std_deviation": 25.0,
           "std_deviation_bounds": {
            "upper": 125.0,
            "lower": 25.0
           }
        }
    }
}</pre>
</div>
<p>
聚合的名称(上面的<code class="literal">grades_stats</code>)也用作键，通过它可以从返回的响应中检索聚合结果。
</p>
<div class="section">
<div class="titlepage"><div><div>
<h3 class="title">
<a id="_standard_deviation_bounds"></a>标准偏差界限 (standard deviation bounds)
</h3>
</div></div></div>
<p>
默认情况下，<code class="literal">extended_stats</code> 度量将返回一个名为 <code class="literal">std_deviation_bounds</code> 的对象，该对象提供了一个距离平均值正负两个标准差的区间。

这是一种可视化数据差异的有用方法。

如果你想要使用不同的边界，例如三个标准偏差，可以在请求中设置 <code class="literal">sigma</code>：
</p>
<div class="pre_wrapper lang-console">
<pre class="programlisting prettyprint lang-console">GET /exams/_search
{
    "size": 0,
    "aggs" : {
        "grades_stats" : {
            "extended_stats" : {
                "field" : "grade",
                "sigma" : 3 <a id="CO187-1"></a><i class="conum" data-value="1"></i>
            }
        }
    }
}</pre>
</div>
<div class="console_widget" data-snippet="snippets/345.console"></div>
<div class="calloutlist">
<table border="0" summary="Callout list">
<tr>
<td align="left" valign="top" width="5%">
<p><a href="#CO187-1"><i class="conum" data-value="1"></i></a></p>
</td>
<td align="left" valign="top">
<p>
<code class="literal">sigma</code> 控制应该显示多少偏离平均值的标准偏差

</p>
</td>
</tr>
</table>
</div>
<p>
<code class="literal">sigma</code> 可以是任何非负的浮点数，这意味着你可以请求非整数值，如<code class="literal">1.5</code>。

值 <code class="literal">0</code> 是有效的，但是将简单地返回<code class="literal">upper</code>(上) 和 <code class="literal">lower</code>(下) 限的平均值。
</p>
<div class="note admon">
<div class="icon"></div>
<div class="admon_content">
<h3>标准差和界限需要正态性</h3>
<p>
默认情况下会显示标准差及其界限，但它们并不总是适用于所有数据集。

数据必须是正态分布的，这样度量才有意义。

标准差背后的统计会假设数据呈正态分布，因此，如果数据严重向左或向右倾斜，返回的值将会产生误导。
</p>
</div>
</div>
</div>

<div class="section">
<div class="titlepage"><div><div>
<h3 class="title">
<a id="_script_6"></a>脚本
</h3>
</div></div></div>
<p>基于脚本计算成绩的统计数据：</p>
<div class="pre_wrapper lang-console">
<pre class="programlisting prettyprint lang-console">GET /exams/_search
{
    "size": 0,
    "aggs" : {
        "grades_stats" : {
            "extended_stats" : {
                "script" : {
                    "source" : "doc['grade'].value",
                    "lang" : "painless"
                 }
             }
         }
    }
}</pre>
</div>
<div class="console_widget" data-snippet="snippets/346.console"></div>
<p>
这将把参数 <code class="literal">script</code> 解释为一个 <code class="literal">inline</code>(内联) 脚本，使用<code class="literal">painless</code>(无痛) 脚本语言，没有脚本参数。

要使用一个已存储的脚本，请使用以下语法：
</p>
<div class="pre_wrapper lang-console">
<pre class="programlisting prettyprint lang-console">GET /exams/_search
{
    "size": 0,
    "aggs" : {
        "grades_stats" : {
            "extended_stats" : {
                "script" : {
                    "id": "my_script",
                    "params": {
                        "field": "grade"
                    }
                }
            }
        }
    }
}</pre>
</div>
<div class="console_widget" data-snippet="snippets/347.console"></div>
<div class="section">
<div class="titlepage"><div><div>
<h4 class="title">
<a id="_value_script_3"></a>值脚本(value script)
</h4>
</div></div></div>
<p>
事实证明，这次考试远远超出了学生的水平，需要进行分数修正。

我们可以使用一个值脚本来获取新的统计数据：
</p>
<div class="pre_wrapper lang-console">
<pre class="programlisting prettyprint lang-console">GET /exams/_search
{
    "size": 0,
    "aggs" : {
        "grades_stats" : {
            "extended_stats" : {
                "field" : "grade",
                "script" : {
                    "lang" : "painless",
                    "source": "_value * params.correction",
                    "params" : {
                        "correction" : 1.2
                    }
                }
            }
        }
    }
}</pre>
</div>
<div class="console_widget" data-snippet="snippets/348.console"></div>
</div>

</div>

<div class="section">
<div class="titlepage"><div><div>
<h3 class="title">
<a id="_missing_value_5"></a>缺失的值
</h3>
</div></div></div>
<p>
参数 <code class="literal">missing</code> 定义应该如何处理有缺失值的文档。 默认情况下，它们会被忽略，但也可以将它们视为有一个(默认)值。
</p>
<div class="pre_wrapper lang-console">
<pre class="programlisting prettyprint lang-console">GET /exams/_search
{
    "size": 0,
    "aggs" : {
        "grades_stats" : {
            "extended_stats" : {
                "field" : "grade",
                "missing": 0 <a id="CO188-1"></a><i class="conum" data-value="1"></i>
            }
        }
    }
}</pre>
</div>
<div class="console_widget" data-snippet="snippets/349.console"></div>
<div class="calloutlist">
<table border="0" summary="Callout list">
<tr>
<td align="left" valign="top" width="5%">
<p><a href="#CO188-1"><i class="conum" data-value="1"></i></a></p>
</td>
<td align="left" valign="top">
<p>
<code class="literal">grade</code> 字段中没有值的文档将与值为 <code class="literal">0</code>的文档落入同一个桶。
</p>
</td>
</tr>
</table>
</div>
</div>

</div>
<div class="navfooter">
<span class="prev">
<a href="search-aggregations-metrics-stats-aggregation.html">« stats 聚合</a>
</span>
<span class="next">
<a href="search-aggregations-metrics-geobounds-aggregation.html">geo_bounds 聚合 »</a>
</span>
</div>
</div>

                  <!-- end body -->
                        </div>
                        <div class="col-xs-12 col-sm-4 col-md-4" id="right_col">
                        
                        </div>
                    </div>
                </div>
            </section>
        </div>
    </section>
</div>
<script src="../static/cn.js"></script>
</body>
</html>